Python 从文件中读取并保存到 utf-8

Ruby，将字符串与 UTF-8 字符进行比较时出现问题

我有这2个UTF-8字符串:a="N\u01b0\u0303"b="N\u1eef"它们看起来很不一样，但渲染后是一样的:irb(main):039:0>puts"#{a}-#{b}"Nữ-Nữa版本是我存储在数据库中的版本。b版本是来自浏览器的POST请求，我不知道为什么浏览器会发送不同的UTF8字符组合，而且这种情况并不总是发生，我不能'在我的开发环境中重现该问题，它发生在生产环境中并且占总请求的百分比。情况是我尝试比较它们，但它们返回false:irb(main):035:0>a==b=>false我尝试过不同的方法，例如强制编码:irb(main):022:0>c.force

时出 UTF-8 code pre section ruby ruby-on-rails-3 unicode character-encoding

ruby - 即时读取压缩的 csv 文件

我已经写了一些csv文件并压缩它，使用这个代码:arr=(0...2**16).to_aFile.open('file.bz2','wb')do|f|writer=Bzip2::Writer.newfCSV(writer)do|csv|(2**16).times{csv我想阅读这个csvbzip2ed文件(用bzip2压缩的csv文件)。这些未压缩的文件如下所示:1,24,125,28,71,3...所以我尝试了这段代码:Bzip2::Reader.open(filename)do|bzip2|CSV.foreach(bzip2)do|row|putsrow.inspectendend

即时 ruby code section csv bzip2

Ruby 1.9 和 Sass 编码问题。 (从 ASCII-8BIT 到 UTF-8)

我最近升级到Ruby1.9，我不能再用Sass编译任何东西。我见过说明我是否放置的解决方案@charset"utf-8";在我的.sccs文件的顶部，它会修复它。但是我仍然遇到错误。这是完整的回溯我也试过从我的CSS文件中删除任何非ascii字符，创建一个新字符等。它就是无法编译。有什么建议吗？回溯:Sassiswatchingforchanges.PressCtrl-Ctostop./home/webdev/.gem/repository/gems/sass-3.1.1/lib/sass/util.rb:496:in`encode':transcodingnotsupported(f

UTF-8 ASCII sass repository webdev ruby encoding

ruby-on-rails - 如何为 UTF-8 字符串编写带有大引号的 gsub？

我正在为String类编写一个扩展方法来清理非ASCII字符。我正在清理的字符串是UTF-8。当在文件中使用非ASCII字符时，控制台不会启动，因为它将弯引号解释为常规引号。如何转义gsub中的大引号？如何编写将unicode用于大引号(例如U+201C)的gsub。使用Rails3.07和Ruby1.9.2。最佳答案您可以在正则表达式中使用与在双引号字符串中使用的相同的\u转义符:s.gsub(/[\u201c\u201d]/,'"')例如:>>s="\u201Cpancakes\u201d"=>"“pancakes”">>p

UTF-8 引号 section code ruby-on-rails ruby unicode ruby-1.9.2

Ruby - 读取 zip 文件中的文本文件的最简单方法

在Ruby中读取zip文件中的文本文件的最简单方法是什么？类似于PHP的file_get_contents("zip://archive.zip#article.txt") 最佳答案 require'zip/zip'Zip::ZipFile.new("archive.zip").read("article.txt") 关于Ruby-读取zip文件中的文本文件的最简单方法，我们在StackOverflow上找到一个类似的问题： https://stackover

本文 Ruby section zip code

ruby 1.9 + sinatra 不兼容的字符编码 : ASCII-8BIT and UTF-8

我正在尝试将sinatra应用程序迁移到ruby1.9我正在使用sinatra1.0、rack1.2.0和erb模板当我启动sinatra时它可以工作，但是当我从浏览器请求网页时出现此错误:Encoding::CompatibilityErrorat/incompatiblecharacterencodings:ASCII-8BITandUTF-8所有.rb文件都有这个标题:#!/usr/bin/envruby#encoding:utf-8我认为问题出在erb文件中，即使它显示它是UTF-8编码[user@localhostviews]$filehome.erbhome.erb:U

UTF-8 sinatra section ruby encoding erb

ruby-on-rails - 使用 Ruby 从文本中删除硬换行符

我有一些带有硬换行符的文本，如下所示:Thisshouldallbeononelinesinceit'sonesentence.Thisisanewparagraphthatshouldbeseparate.我想删除单个换行符但保留双换行符，所以它看起来像这样:Thisshouldallbeononelinesinceit'sonesentence.Thisisanewparagraphthatshouldbeseparate.是否有一个正则表达式可以做到这一点？(或一些简单的方法)到目前为止，这是我唯一可行但感觉很老套的解决方案。txt=txt.gsub(/(\r\n|\n|\r)/

换行符 ruby-on-rails section should ruby regex

ruby - 如何通过 http 使用 Ruby 访问 URL 并读取输出？

到目前为止，我已经能够将它们拼接在一起:)beginopen("http://www.somemain.com/"+path+"/"+blah)rescueOpenURI::HTTPError@failure+=painting.permalinkelse@success+=painting.permalinkend但是我如何读取我要调用的服务的输出呢？最佳答案 Open-URI扩展了open，因此您将获得一种返回的IO流:open('http://www.example.com')#=>#你必须阅读它才能获得内容:open('h

ruby http section code pre

ruby - 从 yaml 文件中读取数据并在 ruby 中生成一个数组

我在yaml文件中有以下数据-----:Subject_listSubject1::Act1:A:Act2:BSubject2::Skill1::Act1:B:Act2:B:Skill2::Act1:B我需要从这个文件中读取数据并生成如下所示的输出-对于主题1，它将是这样的，因为它没有技能水平。表示数组的第一个元素为空。["","Act1","A"],["","Act2","B"]第二个主题是这样的——["Skill1","Act1","B"],["","Act2""B"],["Skill2","Act1","B"]我正在使用这些值生成一个prawnpdf表。任何帮助是极大的赞赏。我试

中生 ruby 34 Subject code yaml

ruby-on-rails - 编码::UndefinedConversionError: "\xC2"从 ASCII-8BIT 到 UTF-8

我在保存新联系人时收到以下错误。有没有办法强制转换"\xC2"以将其强制保存为UTF-8格式？c=Contact.newc.save!Encoding::UndefinedConversionError:"\xC2"fromASCII-8BITtoUTF-8:INSERTINTO"contacts"("body","created_at","email","updated_at")VALUES(?,?,?,?) 最佳答案您的字符串采用其他编码，最有可能是iso-8859-1，因此您应该运行此命令来转换它:"\xC2".encode

UTF-8 UndefinedConversionError section 34 ruby-on-rails ruby

6 7 8910 11 12